ヘルスインフォマティクスは、医療の現場で生まれる膨大なデータを科学的に分析し、より良い治療や公衆衛生の意思決定に役立てる学際的な分野です。Gist.Scienceでは、この分野の最新動向を medRxiv から収集し、専門知識のない方でも理解できるよう平易な解説と、研究者向けの技術的な要約の両方を提供しています。

私たちは medRxiv に公開される新たなプレプリント論文を一つ一つ精査し、その核心となる発見をわかりやすく伝えることに注力しています。複雑な統計手法やアルゴリズムの背後にある医療へのインパクトを、専門用語に頼らずに掘り下げます。

以下に、ヘルスインフォマティクス分野の最新のプレプリント論文一覧を掲載します。

Development of a natural language processing application to extract and categorize mentions of violence from mental healthcare records text

この論文は、南ロンドンの大規模な精神医療機関の電子カルテ自由記述テキストから、暴力の種類、患者の役割、時期、状況、肯定・否定の polarity などを抽出・分類するための多ラベル BERT モデルを開発し、時間的側面を除く主要なカテゴリで高い精度を達成したことを報告しています。

Li, L., Sondh, S., Sondh, H. K., Stewart, R., Roberts, A.2026-03-26📄 health informatics

A statistical framework for evaluating the repeatability and reproducibility of large language models

この論文は、米国 FDA の AI 医療ソフトウェアに関する指針に基づき、意味的および内部的な次元から大規模言語モデル(LLM)の出力の再現性と反復性を定量化する統計的枠組みを開発し、医療診断タスクにおけるその適用可能性と限界を実証的に示したものである。

Shyr, C., Ren, B., Hsu, C.-Y., Yan, C., Tinker, R. J., Cassini, T. A., Hamid, R., Wright, A., Bastarache, L., Peterson, J. F., Malin, B. A., Xu, H.2026-03-25📄 health informatics

Wearable-derived cardiovascular fitness age and its lifestyle correlates in 442 adults

本研究は、442 人の成人を対象とした 12 ヶ月の追跡調査により、ウェアラブルデバイスから算出された「心血管年齢」が、睡眠の質や歩数などの生活習慣と有意に関連し、時間経過に伴う生理学的変化を捉える有効な指標であることを示しました。

Shanmugam, A., Gupta, K., Dhawale, N., Singhal, V., Kumar, M., Srinivasan, B., Narasimhan, V.2026-03-25📄 health informatics

Human-supervised, large language model-based clinical decision support aligned to national newborn protocols in Kenya: a pragmatic, early-stage evaluation

ケニアの低資源環境における新生児ケアにおいて、国家プロトコルに準拠した人間監督型の大規模言語モデルに基づく臨床意思決定支援システム「AIFYA」は、高い専門家評価の一致率とユーザー受容性を示し、その有効性を検証する大規模試験への移行を支持する初期評価結果が得られました。

Kuria, T., Kamau, G., Makokha, F., Omondi, P., Mbugua, G., David, K., Mbugua, S., Gitaka, J.2026-03-25📄 health informatics

Medical errors in large language models revealed using 1,000 synthetic clinical transcripts

この論文は、1,000 件の合成臨床トランスクリプトを用いた大規模シミュレーションにより、大規模言語モデルが診断精度が高くても、不完全な情報に基づいて重要な検査を回避したり、女性患者に対してより安全でないトリアージ判断を下したりする致命的なリスクを明らかにしたことを報告しています。

Auger, S. D., Scott, G.2026-03-25📄 health informatics

The Power of Open Health Data: Impact, Representation, and Knowledge Diffusion

本論文は、4 つの主要なオープンヘルスデータリポジトリを対象とした分析を通じて、資金規模に関わらず間接的な引用増幅が約 10 倍に達する一方で、LMIC からの研究者の関与やジェンダー格差など、資金効率や研究コミュニティの構成には構造的な違いと不平等が存在することを明らかにしています。

Gorijavolu, R., Armengol de la Hoz, M. A., Bielick, C., Cajas, S., Charpignon, M.-L., El Mir, A., Gichoya, J. W., Kwak, H. G., Madapati, K., Mattie, H., McCullum, L., Mwavu, R., Nair, V., Nakayama, L. (…)2026-03-24📄 health informatics

Social Determinants of Health and Chronic Disease Risk Prediction in the All of Us Research Program

「All of Us」研究プログラムの大規模データを用いた分析により、メンタルヘルスと心代謝性疾患のリスク予測において、ストレスや差別などの社会的要因と人口統計学的要因の相対的な重要性が疾患ごとに異なり、これに基づいた疾患特異的な社会決定要因のスクリーニングや介入が健康格差の解消に有効であることが示されました。

Kammer-Kerwick, M., Dave, Y., Parekh, V., McDonald, L., Watkins, S. C.2026-03-23📄 health informatics

Impact of a Social Media Derived Digital Self Management Platform on Population Level Irritable Bowel Syndrome Emergency Utilization: A Controlled Interrupted Time Series Analysis Using South Korean National Health Insurance Data

韓国国民健康保険データを用いた統制された中断時系列分析により、SNS 上の患者議論に基づいて設計されたデジタル自己管理プラットフォーム「腸健康(Jang Geongang)」の導入が、特に若年層および過敏性腸症候群下痢型において、過敏性腸症候群に起因する救急受診を持続的に減少させたことが示されました。

Park, J.-H., Lim, A.2026-03-23📄 health informatics

Automated Extraction of Cancer Registry Data from Pathology Reports: Comparing LLM-Based and Ontology-Driven NLP Platforms

この論文は、膵臓癌および乳癌の病理報告書からレジストリ変数を抽出するタスクにおいて、LLM ベースの Brim Analytics システムが、従来のオントロジー駆動型の DeepPhe システムと同等かそれ以上の精度と処理速度を達成し、癌データ標準化における自動化の有望な手法であることを示しています。

McPhaul, T., Kreimeyer, K., Baris, A., Botsis, T.2026-03-23📄 health informatics